#Nervana Systems
一位晶片老兵,再戰輝達
2016年,當英特爾斥資約3.5億美元收購Nervana Systems時,這家晶片巨頭對人工智慧市場的野心昭然若揭。八年後,Nervana聯合創始人Naveen Rao正帶著一家名為Unconventional的新公司,目標估值50億美元,手握10億美元融資計畫,準備再次向輝達發起衝擊。這一次,他不再是大公司的附庸,而是以獨立創業者的身份,試圖用一種全新的計算架構改寫AI硬體市場的規則。三位神經科學家的創業夢故事要從2014年說起。那一年,“人工智慧”還是一個讓投資者皺眉的詞彙。“當時,人工智慧是一個骯髒的詞,”在肯塔基州長大的Naveen Rao回憶道,他的父母是印度移民。那時的AI被視為“某種失敗,一種拙劣的玩意兒”——一個深奧難懂、令人著迷的研究領域,在大學實驗室和科幻迷中引發熱烈討論,但不被認為具有任何實用價值或商業價值。Rao與Amir Khosrowshahi、Arjun Bansal三人在高通公司相遇。他們都擁有神經科學博士學位——Rao和Bansal是布朗大學的同班同學,Khosrowshahi畢業於加州大學伯克利分校。三人都是科技迷和科幻迷,對《終結者》《駭客帝國》《神經漫遊者》等作品中關於智慧型手機器的想像著迷。“我們所有人都熱衷於當書呆子,”Rao說,“那些關於電腦因為智能而失控的電影總是讓我著迷。”對能夠像人類一樣思考的機器的痴迷,促使三人進入了神經科學領域——研究大腦的運作方式,而這也正是人工智慧研究的核心。在高通工作期間,他們開始談論創辦自己的公司。“我們聊了聊,”來自伊朗的移民Khosrowshahi說,這引出了更嚴肅的話題,關於“我們將如何打造機器學習處理器”。值得注意的是,Khosrowshahi出身於一個著名的技術專家和投資者家族:他的表弟Dara Khosrowshahi曾任Expedia首席執行官,現任Uber首席執行官,並在Nervana早期擔任過導師。那時,三人清楚地意識到,以深度學習形式出現的人工智慧正在蓬勃發展。他們瞄準了這項技術的一大障礙:硬體,特別是微處理器。深度學習涉及更繁重的計算任務,傳統的中央處理器難以輕鬆處理,而用於遊戲和高端圖形的圖形處理器,尤其是輝達的GPU,性能要好得多。“我們有所有這些想法,其中有一個非常實用的想法:我們可以設計製造晶片,”Khosrowshahi說。他們得到了Khosrowshahi在加州大學伯克利分校的導師之一、紅木理論神經科學中心主任Bruno Olshausen的支援。當他們向Olshausen解釋計畫時,這位受人尊敬的神經科學家說:"你必須行動。你必須現在就行動。""他看到我們處於領先地位,甚至領先於其他所有人,"Khosrowshahi回憶道。Bansal指出,Olshausen"不是一個容易激動的人",所以他的熱情反應對他們來說意義重大。艱難的融資之路但讓投資者興奮又是另一回事。2014年,當他們創立Nervana時,人們談論的是“機器學習”,而不是“人工智慧”。Nervana的創始人經常談論另一個當時並不廣為人知的概念:深度學習。深度學習是人工智慧的一個分支,它使計算系統能夠通過人工神經網路來模仿人類大腦的工作方式,這些神經網路能夠拾取、記錄和處理資料和訊號,然後以類似於人類記憶的方式組織資訊。Khosrowshahi的一些親戚告訴他:“我們寧願你別這麼做。”他們擔心人工智慧是一項過於未來化的登月技術。此外,Nervana專注於一個通常會讓投資者感到不安的領域:硬體。“他們知道打造硬體的難度,”Khosrowshahi說。但隨後,轉機出現了。Google於2014年初收購了總部位於倫敦的人工智慧公司DeepMind,當時Nervana正處於創立階段。2016年,DeepMind憑藉其人工智慧系統AlphaGo擊敗了圍棋世界冠軍,一舉引起國際轟動。圍棋是一種類似於國際象棋的複雜棋盤遊戲,電腦一直難以掌握。“DeepMind的成立意義非凡,”Rao說道。它也幫助Nervana籌集了資金。Rao、Khosrowshahi和Bansal在首輪融資中籌集了60萬美元,這筆資金足以讓他們"辭去工作,租一間辦公室,僱人"。之後,他們又籌集了約2400萬美元。突然間,人工智慧成為了人們關注的焦點。隨著人們越來越關注人工智慧在聲控裝置、自動駕駛汽車中所扮演的角色,這些技術總體上“從有趣的玩具變成了可以使用的東西”。晶片是人工智慧潮流的核心。輝達抓住機遇,率先領先。晶片初創公司迅速加入競爭,打造專為人工智慧設計的處理器。在這場競爭中,Nervana已然是先驅。“這是一次幸運的意外,”出生於新德里、後來憑藉南加州大學全額獎學金來到美國的Bansal說道,“我們看到了可以超越圖形晶片進行最佳化的機會。”到2015年末,越來越多的投資者對人工智慧產生了興趣。“現在,每個人都在投資這個領域,”Rao打趣道。更重要的是Nervana團隊對初創企業領域的影響,現在人們更加關注硬體和晶片。“打造硬體真的很難,”Khosrowshahi說,“但現在正值它的黃金時代。”英特爾的橄欖枝而此時的英特爾,正面臨著一個嚴峻的現實:在深度學習晶片市場,這家半導體巨頭正被勁敵輝達擊敗,其在半導體領域的主導地位正在被削弱。深度學習的崛起讓輝達的GPU找到了新的用武之地。這些原本為遊戲和高端圖形設計的處理器,在處理深度學習所需的大規模平行計算時表現出色。輝達迅速佔領了這個新領域,甚至開始將自己定位為一家人工智慧科技公司。“深度學習落到了他們的頭上,”Rao說道。現在,英特爾需要奪回失去的陣地。英特爾首席執行官兼創始人Andy Grove有一句著名的口頭禪:“只有偏執狂才能生存。”這番話成為了矽谷的戰鬥口號,強調了不斷尋找甚至痴迷於新的市場趨勢和威脅的重要性。2016年,Grove去世僅幾個月後,英特爾決定收購Nervana,試圖在這個晶片巨頭曾經缺乏足夠警惕的市場中實現反彈。2016年,當Rao、Khosrowshahi和Bansal正尋求為Nervana籌集更多資金時,另一條道路出現了。Rao說,與英特爾的談判"很快就從融資轉向了收購談判"。“將公司出售給英特爾對我們來說是件有點傷感的事,它是我們的寶貝,”Rao說。但被英特爾這樣的科技巨頭收購意味著獲得巨大的資源,這將給他們帶來巨大的優勢。“英特爾擁有強大的技術資產,”Rao說道,“如果你把它應用到人工智慧領域,我們就能獲得相當大的優勢。”Khosrowshahi表示:“我們當時只是一支很小的團隊,來到了英特爾,而英特爾卻下了很大的賭注。”英特爾最終以約3.5億美元收購了Nervana Systems,旨在打入深度學習訓練晶片市場。此前,這個市場一直由擁有更強大圖形處理單元的輝達公司主導。英特爾的想法是,通過開發專門用於深度學習的專用積體電路,可以獲得超越輝達的競爭優勢。Nervana的短暫輝煌收購完成後,英特爾的人工智慧平台事業部由Rao領導,成員包括Nervana的許多前員工。這是英特爾對AI晶片市場的一次重大押注。英特爾的人工智慧部門已經推出了能夠運行人工智慧系統的晶片。但真正的考驗將在稍後到來——一款名為英特爾Nervana的新處理器,這是這家科技巨頭首款從零開始打造的人工智慧晶片,旨在處理人工智慧所需的海量資料吞吐量。Rao承認他們面臨的挑戰:“我們面對的是一個努力的競爭對手,而且他們很優秀。”輝達一直在努力捍衛其領先地位,其首席執行官黃仁勳當時表示:“我們看到人工智慧正在幾乎所有行業得到應用,從交通運輸到醫療保健,從零售到物流、工業、農業。”2018年,英特爾在人工智慧峰會上正式推出了Nervana神經網路處理器——用於深度學習訓練的NNP-T1000和用於推理的NNP-I1000晶片,並宣佈下一代Movidius VPU將於2020年發佈。這些產品的開發源於英特爾2016年對Nervana和Movidius的收購。Rao在聲明中表示:“隨著人工智慧的下一階段發展,我們在計算硬體和記憶體方面正達到一個臨界點。像英特爾Nervana神經網路處理器和Movidius Myriad視覺處理單元這樣的專用硬體對於人工智慧繼續取得驚人的進步至關重要。”英特爾當時宣稱,目前正在發售的這些晶片旨在為客戶提供“系統級人工智慧方法”,其中包括具有開放元件和深度學習框架整合的完整軟體堆疊。NNP-T1000提供了“計算、通訊和記憶體之間的適當平衡”,使其適用於從小型計算叢集到大型超級電腦的任何裝置。Rao表示,NNP-T1000在ResNet-50和BERT等重要訓練模型上提供了95%的擴展能力,並且在32塊晶片上運行這些模型時性能幾乎不會下降。為了推動新晶片的推廣,英特爾開發了一種新的pod參考設計,該設計由10個機架和480塊NNP-T1000卡組成,這些卡使用英特爾的無膠結構互連。Rao表示:“這款ASIC專門設計用於分佈式訓練,無需切換。”另一方面,NNP-I1000為客戶提供了高效節能且預算充足的產品,可“使用靈活的外形尺寸在現實世界規模上進行密集的多模式推理”。Rao表示,與搭載輝達T4推理GPU的伺服器機架相比,運行NNP-I1000的伺服器機架的計算密度幾乎提高了四倍。“我們擁有的是在單個機架單元中每秒可以進行最多推理的能力,”他說。英特爾表示,Nervana晶片是為了滿足社交媒體巨頭Facebook的人工智慧處理需求而開發的。Facebook人工智慧系統聯合設計總監Misha Smelyanskiy在聲明中表示:“我們很高興能與英特爾合作,利用英特爾Nervana神經網路處理器部署更快、更高效的推理計算,並將我們最先進的深度學習編譯器Glow的支援擴展到NNP-I。”據報導,英特爾曾預計其人工智慧產品將在2019財年創造35億美元的銷售額,其希望新的Nervana和Movidius產品能夠延續這一勢頭,使其產品組合成為業內最廣泛的廣度和深度。突如其來的轉折然而,好景不長。就在Nervana晶片發佈一年多後,2019年12月,英特爾宣佈以20億美元收購另一家AI晶片公司Habana Labs。這次收購為Nervana晶片的命運埋下了伏筆。Habana Labs是一家總部位於以色列的初創公司,自主研發了兩款AI晶片:用於神經網路訓練的Habana Gaudi和用於推理的Habana Goya。問題在於,這兩組晶片的用途與Nervana晶片大致相同——一個用於訓練,一個用於推理,過於雷同的定位,讓英特爾陷入了兩難的糾結。事實上,在英特爾收購Habana時,分析師們就曾對Nervana晶片的未來進行過猜測。Moor Insights & Strategy分析師Karl Freund本人也表示,很難想像Nervana處理器會繼續在英特爾的產品組合中扮演重要角色。原因之一是Habana晶片的性能遠超Nervana。在ResNet-50基準測試中,兩塊Nervana NNP-I晶片每秒可處理10,567個輸入。但在同一測試中,僅一塊Habana Goya晶片就能達到每秒14,451個輸入——性能差距接近1.4倍。Goya不僅性能更強大,而且自2018年以來已開始向客戶發貨,而NNP-I尚未正式發佈。2020年,Karl Freund在《福布斯》雜誌的一篇文章中披露,英特爾已決定停止Nervana神經網路處理器的開發工作,轉而將精力集中在收購Habana Labs時獲得的人工智慧晶片架構上。英特爾告知他,已決定終止Nervana NNP-T訓練晶片和Nervana NNP-I推理晶片的研發工作,但表示仍將履行對後者的客戶承諾。這意味著英特爾在AI晶片市場上為期四年的Nervana計畫宣告終結。從2016年3.5億美元的收購,到2018年的產品發佈,再到2020年的項目終止,Nervana在英特爾內部的生命周期不到四年。放棄Nervana晶片的決定對英特爾的人工智慧平台事業部產生了重大影響。該事業部當時由Nervana Systems聯合創始人Naveen Rao領導,成員包括該公司的許多前員工。英特爾在2019年12月表示,計畫保留Habana作為一個獨立的業務部門,但很可能會將其與人工智慧平台事業部合併。英特爾在這方面有先例,因為它曾在2017年以153億美元收購Mobileye後將其自動駕駛集團與該公司合併,儘管它仍將其保留為一個獨立的業務部門。這是英特爾在AI晶片市場上的一次重大戰略調整。事實上上,Nervana的技術路線最終在與Habana的競爭中落敗了。對於Rao和他的團隊來說,這無疑是一次沉重的打擊——他們傾注心血打造的晶片,最終在母公司內部的競爭中敗下陣來。再次出發Nervana項目終止後,Rao並沒有立即離開英特爾。但最終,他選擇了新的職業道路,加入了資料分析和人工智慧平台公司Databricks,擔任人工智慧主管。Databricks是一家成立於2013年的公司,由Apache Spark的原始開發者創立,專注於為企業提供統一的資料分析和人工智慧平台。在Databricks,Rao負責領導公司的AI戰略和產品開發,這讓他能夠從軟體和平台的角度繼續深入AI領域。在Databricks工作期間,Rao積累了更多關於AI應用層面的經驗和洞察。他看到了企業在部署AI應用時面臨的各種挑戰,也看到了現有硬體架構的侷限性。這些經歷無疑為他後來創立Unconventional埋下了伏筆。但對於一個曾經試圖用專用晶片挑戰輝達的人來說,在軟體平台公司工作或許只是一個過渡期。Rao心中仍然懷揣著硬體夢想,仍然相信通過重新設計計算架構,可以為AI帶來根本性的突破。今年10月,根據知情人士透露,Rao正在為一家名為Unconventional, Inc.的新創業公司洽談籌集10億美元,這家公司正在開發一種新型電腦,其目標估值為50億美元。消息人士稱,Andreessen Horowitz已同意領投,Lightspeed和Lux Capital也參與了此次交易。彭博社報導稱,Databricks也正在投資Rao的新公司。據透露,Rao已經籌集了數億美元,並計畫在10億美元融資輪全部結束後立即著手打造這家初創公司。他計畫分期籌集剩餘資金,這種融資方式通常被稱為"分期"融資。50億美元的估值目標,遠超當年Nervana被收購時的3.5億美元。10億美元的融資規模,也遠超Nervana在被收購前籌集的約2500萬美元。這些數字表明,投資者對Rao的新項目寄予厚望,也反映了AI硬體市場在過去幾年間的巨大變化。Rao拒絕置評,但他上周在X平台上公開承認了這家新創業公司的存在,確認了公司的名稱,並將其預期產品描述為“重新思考電腦的基礎,建構一個與生物學一樣高效的智能新基礎。擺脫生物學包袱,實現大腦規模的效率”。這段描述透露出幾個關鍵資訊。首先,Unconventional不是在做漸進式的改進,而是試圖重新思考電腦的基礎——這是一個極其大膽的目標。其次,與生物學一樣高效暗示了神經形態計算或受大腦啟發的架構,這與Rao的神經科學背景高度契合。第三,擺脫生物學包袱意味著他們不是簡單地模仿大腦,而是要提取其效率原理並超越生物限制。從Rao的背景來看,這個方向並不令人意外。他擁有神經科學博士學位,創立Nervana時就是從神經科學的角度思考如何建構更好的AI晶片。現在,他似乎想要更徹底地實現這一願景。市場環境的巨變與2014年創立Nervana時相比,如今的AI硬體市場已經發生了翻天覆地的變化。最顯著的變化是市場規模的爆炸式增長。2014年,投資者對AI硬體還持謹慎態度。如今,生成式AI的爆發讓AI晶片成為了最炙手可熱的賽道之一。輝達的市值突破4兆美元,成為全球市值最高的公司之一,其資料中心業務(主要由AI晶片驅動)的季度營收已經超過數百億美元。其次是競爭格局的變化。2014年,輝達在AI晶片市場幾乎沒有競爭對手。如今,除了英特爾、AMD等傳統晶片廠商,還湧現出了大量AI晶片初創公司,包括Graphcore、Cerebras、SambaNova等。更重要的是,科技巨頭們紛紛自研AI晶片:Google有TPU,亞馬遜有Trainium和Inferentia,微軟正在開發Maia,Meta也在投資自研晶片。第三是技術路線的多元化。早期的AI晶片主要聚焦於加速深度學習訓練和推理,現在則出現了更多創新方向:模擬計算、神經形態晶片、光子計算、量子計算等。這為新進入者提供了差異化競爭的機會。第四是資本環境的變化。在生成式AI熱潮的推動下,投資者對AI硬體初創公司的興趣空前高漲。像Groq這樣的AI晶片初創公司能夠在短時間內籌集數億美元,估值達到數十億美元。Unconventional的50億美元估值目標,雖然雄心勃勃,但在當前的市場環境下並非不可想像。然而,Rao和Unconventional面臨的挑戰也是前所未有的。首先是輝達的護城河已經變得更深。除了技術優勢,輝達還建立了強大的軟體生態系統——CUDA平台經過近二十年的發展,已經成為AI開發者的標準工具。任何新的AI晶片,如果不能提供與CUDA相容或同等便利的軟體工具鏈,都很難獲得開發者的青睞。其次是客戶慣性。經過多年的發展,主要的AI應用都是基於輝達GPU開發和最佳化的。要說服客戶切換到新的硬體平台,不僅需要顯著的性能或成本優勢,還需要完整的遷移方案和長期的技術支援承諾。第三是製造和供應鏈的挑戰。先進的AI晶片需要最先進的製程工藝,這意味著要與台積電等晶圓廠商建立合作關係,並在產能分配上與輝達、蘋果、AMD等巨頭競爭。這對初創公司來說是一個巨大的挑戰。第四是人才競爭。頂尖的晶片設計人才供不應求,科技巨頭和成功的初創公司都在高薪挖人。Unconventional需要組建一支世界級的團隊,這需要時間和資源。但Rao也有自己的優勢。他有過完整的AI晶片創業經歷,知道那些坑需要避免。他在英特爾的經歷讓他深入理解了大公司的運作方式和侷限性,而在Databricks的工作也讓他更瞭解AI應用的實際需求。結語從某種意義上說,Rao的職業生涯形成了一個完整的敘事弧線。2014年,他和兩位神經科學傢伙伴創立Nervana,試圖用專用晶片挑戰輝達的GPU霸主地位。那時AI還是一個"骯髒的詞",他們籌集了2500萬美元,被認為是瘋狂的賭博。2016年,英特爾以3.5億美元收購Nervana,Rao成為這家晶片巨頭AI部門的領導者。他們開發出了Nervana NNP系列晶片,在某些指標上展現出了與輝達競爭的潛力。2020年,英特爾放棄Nervana晶片,轉向Habana的技術路線。這次失敗的經歷無疑是痛苦的,但也讓Rao更深刻地理解了在大公司體系內推動創新的困難,以及技術路線選擇的重要性。現在,他帶著Unconventional重新出發,目標估值50億美元,手握10億美元融資計畫。這一次,他不再是被收購的創業者,不再需要在大公司的體系內妥協和權衡。他可以按照自己的願景,從零開始建構一種全新的計算架構。而他的對手,依然是輝達。只不過,這個對手已經比十年前強大了無數倍。輝達的市值從2014年的百億美元等級,增長到了2024年的數兆美元。其在AI晶片市場的份額超過80%,幾乎壟斷了資料中心AI訓練市場。黃仁勳已經成為科技界最有影響力的CEO之一,輝達也從一家圖形晶片公司轉型為AI計算的代名詞。但市場也比十年前大了無數倍。2014年,全球AI晶片市場規模只有數十億美元。到2024年,這個數字已經是數千億美元,並且還在快速增長。即使只能佔據這個市場的一小部分,也足以支撐起一家價值數十億甚至上百億美元的公司。更重要的是,技術風向正在發生變化。過去十年,AI晶片的發展主要是在現有的馮·諾依曼架構基礎上進行最佳化——增加算力、擴展頻寬、提升平行度。但隨著AI模型規模的指數級增長,這種方式正在遇到物理極限和能效瓶頸。這正是Rao所說的“重新思考電腦的基礎”的意義所在。如果Unconventional真的能夠開發出一種在能效比上實現數量級突破的新型計算架構,那麼它就有機會在這個看似被輝達壟斷的市場中撕開一道口子。 (半導體行業觀察)